Average sentence length | # of sentences | Source |
---|---|---|
71.70 | 10 | http://he.wikipedia.org/wiki/יבגני_אונייגין |
75.09 | 11 | http://he.wikipedia.org/wiki/נורת'ר |
85.45 | 11 | http://he.wikipedia.org/wiki/מורה_דרך_בארץ_ישראל_וסוריה |
89.31 | 13 | http://he.wikipedia.org/wiki/הפוני_הקטן_שלי:_חברות_היא_קסם |
89.70 | 10 | http://he.wikipedia.org/wiki/טבעת_הניבלונגים |
90.55 | 11 | http://he.wikipedia.org/wiki/מיקמק_-_הסדרה |
92.33 | 12 | http://he.wikipedia.org/wiki/הקרב_על_קיבוץ_גשר |
95.54 | 13 | http://he.wikipedia.org/wiki/אי-שרדות:_המירוץ |
95.58 | 12 | http://he.wikipedia.org/wiki/ספטימוס_היפ |
96.08 | 13 | http://he.wikipedia.org/wiki/מתקנים_לגידול_יונים_בארץ_ישראל |
96.30 | 10 | http://he.wikipedia.org/wiki/WCW |
96.40 | 10 | http://he.wikipedia.org/wiki/מייק_ומולי |
96.50 | 12 | http://he.wikipedia.org/wiki/קוגר_טאון |
96.55 | 11 | http://he.wikipedia.org/wiki/תיירי_הנרי |
101.20 | 10 | http://he.wikipedia.org/wiki/רפובליקת_פירנצה |
101.60 | 10 | http://he.wikipedia.org/wiki/זית_אירופי |
101.83 | 12 | http://he.wikipedia.org/wiki/אני_מספר_ארבע_(ספר) |
102.08 | 12 | http://he.wikipedia.org/wiki/נעלמים |
102.83 | 12 | http://he.wikipedia.org/wiki/בית_מלון_לכלבים |
103.20 | 10 | http://he.wikipedia.org/wiki/אשר_(זמר) |
104.60 | 10 | http://he.wikipedia.org/wiki/תותח_קרופ_75 |
104.80 | 10 | http://he.wikipedia.org/wiki/שארל_בואייה |
105.00 | 10 | http://he.wikipedia.org/wiki/פות |
105.40 | 10 | http://he.wikipedia.org/wiki/הקרב_על_חיפה |
105.50 | 10 | http://he.wikipedia.org/wiki/סקרז'יסקו-קמיינה |
105.81 | 16 | http://he.wikipedia.org/wiki/משפחת_קיין_והאלים_המצריים |
107.17 | 12 | http://he.wikipedia.org/wiki/יעל_אתיופי |
107.45 | 11 | http://he.wikipedia.org/wiki/פילה_(מצרים) |
107.67 | 15 | http://he.wikipedia.org/wiki/כתום_זה_השחור_החדש |
107.70 | 10 | http://he.wikipedia.org/wiki/מאו_מאו |
Average sentence length | # of sentences | Source |
---|---|---|
289.08 | 13 | http://he.wikipedia.org/wiki/ריבוי_מעוולים |
286.91 | 11 | http://he.wikipedia.org/wiki/אוסטרלופיתקוס |
285.50 | 10 | http://he.wikipedia.org/wiki/תאוריות_הקשר_על_הכוזרים_והיהודים |
284.55 | 11 | http://he.wikipedia.org/wiki/מבצע_צלבן |
282.90 | 10 | http://he.wikipedia.org/wiki/שפד"ן |
280.93 | 14 | http://he.wikipedia.org/wiki/דגל_גרמניה |
278.30 | 10 | http://he.wikipedia.org/wiki/אירוויזיון_1956 |
277.10 | 10 | http://he.wikipedia.org/wiki/קרבות_רמלה |
275.26 | 23 | http://he.wikipedia.org/wiki/קרב_קורסון-צ'רקאסי |
275.06 | 17 | http://he.wikipedia.org/wiki/ההיסטוריוגרפיה_של_נפילת_האימפריה_העות'מאנית |
272.50 | 10 | http://he.wikipedia.org/wiki/התקופה_הפרסית_בארץ_ישראל |
271.90 | 10 | http://he.wikipedia.org/wiki/אל_תשאל,_אל_תספר |
268.80 | 10 | http://he.wikipedia.org/wiki/אדוארד_מייברידג' |
266.68 | 19 | http://he.wikipedia.org/wiki/תיאור_מפעלותיו_של_אוגוסטוס_האלוהי |
266.00 | 13 | http://he.wikipedia.org/wiki/מבצע_מרקט_גארדן |
265.36 | 11 | http://he.wikipedia.org/wiki/נוקליאוסינתזה |
263.08 | 12 | http://he.wikipedia.org/wiki/העלייה_מרומניה |
262.58 | 12 | http://he.wikipedia.org/wiki/רישום_זכויות_במקרקעין_בישראל |
260.30 | 10 | http://he.wikipedia.org/wiki/גאופוליטיקה |
259.73 | 11 | http://he.wikipedia.org/wiki/כלכלת_הרשות_הפלסטינית |
259.62 | 21 | http://he.wikipedia.org/wiki/כנף_קרב_52_(לופטוואפה) |
258.60 | 10 | http://he.wikipedia.org/wiki/הומו_ארגסטר |
258.27 | 11 | http://he.wikipedia.org/wiki/אייבל_ארצ'ר_83 |
257.83 | 23 | http://he.wikipedia.org/wiki/משרד_הכלכלה_והתעשייה |
256.92 | 12 | http://he.wikipedia.org/wiki/אלכימיה |
256.50 | 10 | http://he.wikipedia.org/wiki/אוריה_שביט |
256.36 | 11 | http://he.wikipedia.org/wiki/ספורט_ברומא_העתיקה |
256.33 | 12 | http://he.wikipedia.org/wiki/ביל_היקוק_הפראי |
256.27 | 11 | http://he.wikipedia.org/wiki/פולאן_דווי |
256.00 | 10 | http://he.wikipedia.org/wiki/סיבוב_אורוגוואי |
The following subsections compare different text parameters for the different sources. First we looh for the sources having minimal and maximal average sentence length, respectively. To get reliable averages, we only use sources containing at least 10 sentences.
Average sentence length varies with text genre. In the case of newspaper corpora, we see big differences between yellow press and technical journals.
First table:
select round(avg(length(sentence)),2) as le, count(sentence) as cnt, source from sentences s, inv_so i, sources so where s.s_id=i.s_id and i.so_id=so.so_id group by source having cnt>=10 order by le limit 30;